# encoding: utf-8

# 导入原始数据

__package__ = ['load_data']
import pandas as pd
import numpy as np

def load_source(filename):
    source = pd.read_excel(filename, sheetname=[
        "总表", 
        "2004年甲", 
        "2007年甲", 
        "2010年甲", 
        "2013年甲", 
        "2016年甲", 
        "2004年乙",
        "2007年乙",
        "2010年乙",
        "2013年乙",
        "2016年乙"
        ], skip_rows=2, index=0, header=2)
    return source


def load_all_table(source) -> np.ndarray:
    '''加载总表数据 '''
    c = source['总表']
    c = c.iloc[:-2, 1:]
    c.dtype="float"
    return c.values


def load_all_table_source(source) -> np.ndarray:
    '''加载总表数据 '''
    c = source['总表']
    c = c.iloc[:-2, 1:]
    c.dtype="float"
    return c


def load_item_table(source, itemname) -> np.ndarray:
    '''加载指定脚本数据'''

    c = source[itemname]
    c = c.iloc[:-2, 1:]
    return c
    
def load_local_infects_data(source: pd.core.frame.DataFrame):
    s4 = source['2004年甲']
    s7 = source['2007年甲']
    s10 = source['2010年甲']
    s13 = source['2013年甲']
    s16 = source['2016年甲']

    s40 = s4['发病数.4'][1:]
    s70 = s7['发病数.4'][1:]
    s100 = s10['发病数.4'][1:]
    s130 = s13['发病数.4'][1:]
    s160 = s16['发病数.4'][1:]

    A = pd.DataFrame({4: s40, 7: s70, 10: s100, 13: s130, 16:s160})
    A.reset_index(drop=True, inplace=True)
    return A


# 加载地区
def load_area_name(source):
    s4 = source['2004年甲']
    return s4['地区'][1:].reset_index(drop=True)


# 加载职业
def load_profession(source):
    s = source['2004年乙']
    return s['职 业'][:]


# 加载职业感染人数
def load_profession_infect_data(source):
    s4 = source['2004年乙']
    s7 = source['2007年乙']
    s10 = source['2010年乙']
    s13 = source['2013年乙']
    s16 = source['2016年乙']

    s40 = s4['发病数.4'][:]
    s70 = s7['发病数.4'][:]
    s100 = s10['发病数.4'][:]
    s130 = s13['发病数.4'][:]
    s160 = s16['发病数.4'][:]

    A = pd.DataFrame({4: s40, 7: s70, 10: s100, 13: s130, 16:s160})
    A.reset_index(drop=True, inplace=True)
    return A


# 加载职业死亡人数
def load_profession_dead_data(source):
    s4 = source['2004年乙']
    s7 = source['2007年乙']
    s10 = source['2010年乙']
    s13 = source['2013年乙']
    s16 = source['2016年乙']

    s40 = s4['死亡数.4'][:]
    s70 = s7['死亡数.4'][:]
    s100 = s10['死亡数.4'][:]
    s130 = s13['死亡数.4'][:]
    s160 = s16['死亡数.4'][:]

    A = pd.DataFrame({4: s40, 7: s70, 10: s100, 13: s130, 16:s160})
    A.reset_index(drop=True, inplace=True)
    return A



def load_local_dead_data(source):
    s4 = source['2004年甲']
    s7 = source['2007年甲']
    s10 = source['2010年甲']
    s13 = source['2013年甲']
    s16 = source['2016年甲']

    s40 = s4['死亡数.4'][1:]
    s70 = s7['死亡数.4'][1:]
    s100 = s10['死亡数.4'][1:]
    s130 = s13['死亡数.4'][1:]
    s160 = s16['死亡数.4'][1:]

    A = pd.DataFrame({4: s40, 7: s70, 10: s100, 13: s130, 16:s160})
    A.reset_index(drop=True, inplace=True)
    return A


def load_gpd_source(filename):
    source = pd.read_excel(filename)
    return source